首页> 外文OA文献 >Distilling an Ensemble of Greedy Dependency Parsers into One MST Parser
【2h】

Distilling an Ensemble of Greedy Dependency Parsers into One MST Parser

机译:将一组贪婪的依赖解析器提炼成一个msT解析器

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

We introduce two first-order graph-based dependency parsers achieving a newstate of the art. The first is a consensus parser built from an ensemble ofindependently trained greedy LSTM transition-based parsers with differentrandom initializations. We cast this approach as minimum Bayes risk decoding(under the Hamming cost) and argue that weaker consensus within the ensemble isa useful signal of difficulty or ambiguity. The second parser is a"distillation" of the ensemble into a single model. We train the distillationparser using a structured hinge loss objective with a novel cost thatincorporates ensemble uncertainty estimates for each possible attachment,thereby avoiding the intractable cross-entropy computations required byapplying standard distillation objectives to problems with structured outputs.The first-order distillation parser matches or surpasses the state of the arton English, Chinese, and German.
机译:我们介绍了两个基于图的一阶依赖解析器,它们实现了最新的技术水平。第一个是共识解析器,它是由具有不同随机初始化的,经过独立训练的贪婪的基于LSTM过渡的解析器集成而成的。我们将此方法视为最小贝叶斯风险解码(在汉明成本下),并认为集合内较弱的共识是困难或模棱两可的有用信号。第二个解析器是将集合“蒸馏”成单个模型。我们使用结构化铰链损失目标训练蒸馏分析器,并采用新颖的成本为每个可能的附件合并整体不确定性估计,从而避免了将标准蒸馏目标应用于结构化输出问题所需要的棘手的交叉熵计算。一阶蒸馏分析器匹配或超过了英语,中文和德语的最新水平。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号